Structure Réutilisable pour le Calcul et la Manipulation des Cubes de Données
نویسندگان
چکیده
Résumé. Les cubes de données sont de plus en plus utilisés pour le pré-calcul de requêtes OLAP afin de permettre essentiellement à des analystes de trouver des tendances ou des anomalies dans de grandes quantités de données. Il se révèle que tout problème lié aux cubes de données est coûteux, que ce soit pour la construction, la matérialisation, la manipulation ou la mise à jour. Dans cet article, nous introduisons la notion de pré-calcul de cubes de données et la caractérisation associée qui est basée sur le modèle partitionnel. A notre connaissance, aucune des approches actuelles ne s’est intéressée à la réutilisation de pré-calcul des cubes de données. Pourtant cette dernière permet de calculer et de manipuler efficacement des cubes de données dans plusieurs contextes comme les applications météorologiques, le calcul de requêtes à la volée ou encore le calcul de plusieurs cubes de données en réseau ou en local.
منابع مشابه
C-CUBE: Un nouvel opérateur d'agrégation pour les entrepôts de données en colonnes
RÉSUMÉ. Les bases de données orientées colonnes offrent au domaine décisionnel le modèle le plus approprié au stockage des entrepôts de données. Cependant, en l’absence d’opérateurs d’analyse en ligne, le seul moyen, très coûteux, qui existe pour construire des cubes OLAP consiste à utiliser l’opérateur UNION sur des requêtes de regroupement afin d’obtenir l’ensemble des Group By nécessaires au...
متن کاملCubes convexes
RÉSUMÉ. De nombreuses approches ont proposé de pré-calculer des cubes de données afin de répondre efficacement aux requêtes OLAP. La notion de cube de données a été déclinée de différentes manières : cubes icebergs, cubes intervallaires ou encore cubes différentiels. Dans cet article, nous introduisons le concept de cube convexe qui permet de capturer tous les tuples d’un cube de données satisf...
متن کاملApproche géosémantique intégrée pour les cubes évolutifs de données géospatiales
RtSUMt. Da"s un contexte décisionnel, les bases de données géospatiales multidimensionnelles représentent souvem des données provenant de sources hétérogènes et évolutives. L'évolution de la Slnicture multidimensionnelle el de l'évolution du découpage spatial empêchent le lraitement des requêtes spaliotemporefles. en raison de l'absence de liens entre les cubes créés li différentes époques. Dan...
متن کاملEntrepôts de données sur grilles de calcul
Résumé Les entrepôts de données sont utilisés pour l'exploitation et l'analyse de grands volumes de données extraits des systèmes d'informations en exploitation. Un modèle multidimensionnel organise l'entrepôt de données selon plusieurs axes d'analyse appelés « dimensions ». Les systémes OLAP (OnLine Analytical Processing) permettent une exploration interactive des données contenues dans un ent...
متن کاملgapIT : Un outil visuel pour l'imputation de valeurs manquantes en hydrologie
Résumé. Les données manquantes sont problématiques en hydrologie, car elles gênent le calcul de statistiques interannuelles et sur de longues périodes, ainsi que l’analyse et l’interprétation de la variabilité des données. Dans cet article, nous présentons gapIT, une plateforme d’analyse de données permettant d’inspecter visuellement les données manquantes et ensuite de choisir la méthode de co...
متن کامل